Model Selection

Cross-Domain Visual Question Answering

# Cross-Domain Visual Question Answering

MoVA-8B is an open-source multimodal large language model that uses a coarse-to-fine mechanism to adaptively route and fuse visual expert modules for specific tasks. It can be used for research on multimodal models and chatbots.

Multimodal Fusion

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase